যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক

- পরিসংখ্যান - পরিসংখ্যান ২য় পত্র | | NCTB BOOK
6
6

যথার্থতা যাচাই এর জন্য ব্যবহৃত বিভিন্ন স্ট্যাটিস্টিক:

যথার্থতা যাচাই পরিসংখ্যানের গুরুত্বপূর্ণ একটি দিক। এর মাধ্যমে ডেটা বা পরিমাপের সঠিকতা ও নির্ভুলতা নির্ধারণ করা হয়। নিচে যথার্থতা যাচাইয়ের জন্য ব্যবহৃত বিভিন্ন গুরুত্বপূর্ণ স্ট্যাটিস্টিক তুলে ধরা হলো:


১. গড় ত্রুটি (Mean Error):

  • সংজ্ঞা: গড় ত্রুটি হলো পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় পার্থক্য।
  • সূত্র:
    \[
    \text{Mean Error} = \frac{\sum_{i=1}^{n} (X_i - T)}{n}
    \]
    যেখানে,
    \(X_i\) = পরিমাপকৃত মান
    \(T\) = প্রকৃত মান
    \(n\) = মোট পরিমাপের সংখ্যা

২. গড় বর্গমূল ত্রুটি (Root Mean Square Error - RMSE):

  • সংজ্ঞা: এটি একটি বহুল ব্যবহৃত পরিসংখ্যান, যা ত্রুটির স্কোয়ারের গড়ের বর্গমূল নির্দেশ করে। এটি ডেটার বিচ্যুতি পরিমাপ করে।
  • সূত্র:
    \[
    \text{RMSE} = \sqrt{\frac{\sum_{i=1}^{n} (X_i - T)^2}{n}}
    \]

৩. গড় আপেক্ষিক ত্রুটি (Mean Absolute Error - MAE):

  • সংজ্ঞা: পরিমাপকৃত মান এবং প্রকৃত মানের মধ্যে গড় আপেক্ষিক পার্থক্য। এটি ত্রুটির একটি সরল মাপকাঠি।
  • সূত্র:
    \[
    \text{MAE} = \frac{\sum_{i=1}^{n} |X_i - T|}{n}
    \]

৪. শতকরা ত্রুটি (Percentage Error):

  • সংজ্ঞা: পরিমাপকৃত মানের শতকরা বিচ্যুতি।
  • সূত্র:
    \[
    \text{Percentage Error} = \frac{|X - T|}{T} \times 100%
    \]

৫. সহগ (Coefficient of Variation - CV):

  • সংজ্ঞা: এটি গড় মানের তুলনায় ডেটার বিচ্যুতি নির্ধারণ করে।
  • সূত্র:
    \[
    \text{CV} = \frac{\sigma}{\mu} \times 100
    \]
    যেখানে,
    \(\sigma\) = ডেটার মানের স্ট্যান্ডার্ড ডেভিয়েশন
    \(\mu\) = গড়

৬. নির্ভুলতার সহগ (Accuracy Ratio):

  • সংজ্ঞা: এটি পরিমাপের সঠিকতা বুঝাতে ব্যবহৃত হয় এবং প্রকৃত মানের সাথে ডেটার সামঞ্জস্যতা নির্দেশ করে।
  • সূত্র:
    \[
    \text{Accuracy Ratio} = \frac{\text{Predicted Value}}{\text{Actual Value}}
    \]

৭. কপেলার সহগ (Correlation Coefficient):

  • সংজ্ঞা: এটি দুই ডেটাসেটের মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। যথার্থতার জন্য উচ্চতর সহগ ভালো বলে ধরা হয়।
  • সূত্র:
    \[
    r = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum_{i=1}^{n} (X_i - \bar{X})^2 \cdot \sum_{i=1}^{n} (Y_i - \bar{Y})^2}}
    \]

৮. স্ট্যান্ডার্ড ডেভিয়েশন (Standard Deviation):

  • সংজ্ঞা: এটি ডেটাসেটের গড় থেকে বিচ্যুতির গড় নির্দেশ করে। কম স্ট্যান্ডার্ড ডেভিয়েশন উচ্চ যথার্থতা নির্দেশ করে।
  • সূত্র:
    \[
    \sigma = \sqrt{\frac{\sum_{i=1}^{n} (X_i - \bar{X})^2}{n}}
    \]

৯. R-Squared (Coefficient of Determination):

  • সংজ্ঞা: এটি একটি পরিসংখ্যান, যা পূর্বানুমান এবং প্রকৃত ডেটার মধ্যে সামঞ্জস্যতা নির্দেশ করে।
  • রেঞ্জ: ০ থেকে ১ (১ হলে এটি পূর্ণ সঙ্গতিপূর্ণ)।

উপসংহার:
উপরোক্ত পরিসংখ্যানগুলো ব্যবহার করে যথার্থতা যাচাই করা যায়। নির্ভুলতা এবং সঠিকতা নিশ্চিত করতে এই মেট্রিক্সগুলো গবেষণা ও বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে।

Promotion